智能论文笔记

Fine-resolution landscape-scale biomass mapping using a spatiotemporal patchwork of LiDAR coverages

Lucas K. Johnson , Michael J. Mahoney , Eddie Bevilacqua , Stephen V. Stehman , Grant Domke , Colin M. Beier

分类：机器学习

2022-05-17

估计大规模森林AGB和精细的空间决议对于温室气体会计，监测和验证工作以减轻气候变化的范围变得越来越重要。机载LiDAR对于在包括AGB在内的森林结构的属性建模非常有价值，但大多数LiDAR收集都发生在涵盖不规则，不连续的足迹的本地或区域尺度上，导致不同景观细分市场在各个时间点进行拼布。在这里，作为纽约州（美国）全州森林碳评估的一部分，我们解决了利用激光雷达拼布在景观尺度上的雷达拼凑而成的障碍，包括选择培训数据，对预测的区域或覆盖范围的特定模式的调查错误，并绘制与多个量表的现场清单一致。三种机器学习算法和一个集合模型经过FIA场测量，空气传播的激光雷达和地形，气候和心形地理训练。使用一组严格的地块选择标准，选择了801个FIA图，并从17个叶子覆盖范围（2014-2019）的拼布中绘制的共同定位的点云（2014-2019）。我们的合奏模型用于在预测定义的适用性区域（占激光雷达覆盖率的98％）内生成30 m AGB的预测表面，并将所得的AGB图与FIA绘图级别和面积估计值进行比较。我们的模型总体准确（％RMSE 22-45％; MAE 11.6-29.4 mg ha $^{ - 1} $; me 2.4-6.3 mg ha $^{ - 1} $），解释了73-80％的领域 - 观察到的变化，并得出与FIA基于设计的估计值一致的估计值（FIA 95％CI中的估计值的89％）。我们分享实用的解决方案，以使用LIDAR的时空拼布面临的挑战来满足不断增长的AGB映射需求，以支持森林碳会计和生态系统中的应用。

translated by 谷歌翻译

Programming Is Hard -- Or at Least It Used to Be: Educational Opportunities And Challenges of AI Code Generation

Brett A. Becker , Paul Denny , James Finnie-Ansley , Andrew Luxton-Reilly , James Prather , Eddie Antonio Santos

分类：人工智能 | 机器学习

2022-12-02

The introductory programming sequence has been the focus of much research in computing education. The recent advent of several viable and freely-available AI-driven code generation tools present several immediate opportunities and challenges in this domain. In this position paper we argue that the community needs to act quickly in deciding what possible opportunities can and should be leveraged and how, while also working on how to overcome or otherwise mitigate the possible challenges. Assuming that the effectiveness and proliferation of these tools will continue to progress rapidly, without quick, deliberate, and concerted efforts, educators will lose advantage in helping shape what opportunities come to be, and what challenges will endure. With this paper we aim to seed this discussion within the computing education community.

translated by 谷歌翻译

Improving the Predictive Performances of $k$ Nearest Neighbors Learning by Efficient Variable Selection

Eddie Pei , Ernest Fokoue

分类： (统计)机器学习 | 机器学习

2022-11-04

This paper computationally demonstrates a sharp improvement in predictive performance for $k$ nearest neighbors thanks to an efficient forward selection of the predictor variables. We show both simulated and real-world data that this novel repeatedly approaches outperformance regression models under stepwise selection

translated by 谷歌翻译

A Generalist Neural Algorithmic Learner

Borja Ibarz , Vitaly Kurin , George Papamakarios , Kyriacos Nikiforou , Mehdi Bennani , Róbert Csordás , Andrew Dudzik , Matko Bošnjak , Alex Vitvitskyi , Yulia Rubanova

分类：机器学习 | 人工智能 | (统计)机器学习

2022-09-22

神经算法推理的基石是解决算法任务的能力，尤其是以一种概括分布的方式。尽管近年来，该领域的方法学改进激增，但它们主要集中在建立专家模型上。专业模型能够学习仅执行一种算法或具有相同控制流骨干的算法的集合。相反，在这里，我们专注于构建通才神经算法学习者 - 单个图形神经网络处理器，能够学习执行各种算法，例如分类，搜索，动态编程，路径触发和几何学。我们利用CLRS基准来凭经验表明，就像在感知领域的最新成功一样，通才算法学习者可以通过“合并”知识来构建。也就是说，只要我们能够在单任务制度中学习很好地执行它们，就可以以多任务的方式有效地学习算法。在此激励的基础上，我们为CLR提供了一系列改进，对CLR的输入表示，培训制度和处理器体系结构，将平均单任务性能提高了20％以上。然后，我们进行了多任务学习者的彻底消融，以利用这些改进。我们的结果表明，一位通才学习者有效地结合了专家模型所捕获的知识。

translated by 谷歌翻译

A Tutorial on the Spectral Theory of Markov Chains

Eddie Seabrook , Laurenz Wiskott

分类：机器学习

2022-07-05

马尔可夫链是一类概率模型，在定量科学中已广泛应用。这部分是由于它们的多功能性，但是可以通过分析探测的便利性使其更加复杂。本教程为马尔可夫连锁店提供了深入的介绍，并探索了它们与图形和随机步行的联系。我们利用从线性代数和图形论的工具来描述不同类型的马尔可夫链的过渡矩阵，特别着眼于探索与这些矩阵相对应的特征值和特征向量的属性。提出的结果与机器学习和数据挖掘中的许多方法有关，我们在各个阶段描述了这些方法。本文并没有本身就成为一项新颖的学术研究，而是提出了一些已知结果的集合以及一些新概念。此外，该教程的重点是向读者提供直觉，而不是正式的理解，并且仅假定对线性代数和概率理论的概念的基本曝光。因此，来自各种学科的学生和研究人员可以访问它。

translated by 谷歌翻译

Understanding and Extending Subgraph GNNs by Rethinking Their Symmetries

Fabrizio Frasca , Beatrice Bevilacqua , Michael M. Bronstein , Haggai Maron

分类：机器学习

2022-06-22

子图GNNS是最近表达的图形神经网络（GNN）的一类，它们将图形图形为子图的集合。到目前为止，可能的子图GNN体系结构的设计空间及其基本理论属性仍然在很大程度上尚未探索。在本文中，我们研究了子图方法的最突出形式，该方法采用了基于节点的子图选择策略，例如自我网络或节点标记和删除。我们解决了两个中心问题：（1）这些方法的表达能力的上限是什么？（2）在这些子图集上传递层的模棱两可的消息家族是什么？我们回答这些问题的第一步是一种新颖的对称分析，该分析表明，建模基于节点的子图集的对称性需要比以前的作品中所采用的对称组明显小。然后，该分析用于建立子图GNN和不变图网络（IGNS）之间的联系。我们通过首先通过3-WL来界定子图方法的表达能力，然后提出一个通用子图方法的一般家族，以将所有先前基于节点的子图GNN泛化。最后，我们设计了一个新颖的子图Gnn称为Sun，从理论上讲，该子gnn统一了以前的体系结构，同时在多个基准上提供了更好的经验性能。

translated by 谷歌翻译

Beyond the Imitation Game: Quantifying and extrapolating the capabilities of language models

Aarohi Srivastava , Abhinav Rastogi , Abhishek Rao , Abu Awal Md Shoeb , Abubakar Abid , Adam Fisch , Adam R. Brown , Adam Santoro , Aditya Gupta , Adrià Garriga-Alonso

分类：自然语言处理 | 人工智能 | 机器学习 | (统计)机器学习

2022-06-09

语言模型既展示了定量的改进，又展示了新的定性功能，随着规模的增加。尽管它们具有潜在的变革性影响，但这些新能力的特征却很差。为了为未来的研究提供信息，为破坏性的新模型能力做准备，并改善社会有害的效果，至关重要的是，我们必须了解目前和近乎未来的能力和语言模型的局限性。为了应对这一挑战，我们介绍了超越模仿游戏基准（Big Bench）。 Big Bench目前由204个任务组成，由132家机构的442位作者贡献。任务主题是多样的，从语言学，儿童发展，数学，常识性推理，生物学，物理学，社会偏见，软件开发等等。 Big-Bench专注于被认为超出当前语言模型的功能的任务。我们评估了OpenAI的GPT型号，Google内部密集变压器体系结构和大型基础上的开关稀疏变压器的行为，跨越了数百万到数十亿个参数。此外，一个人类专家评估者团队执行了所有任务，以提供强大的基准。研究结果包括：模型性能和校准都随规模改善，但绝对的术语（以及与评估者的性能相比）；在模型类中的性能非常相似，尽管带有稀疏性。逐渐和预测的任务通常涉及大量知识或记忆成分，而在临界规模上表现出“突破性”行为的任务通常涉及多个步骤或组成部分或脆性指标；社交偏见通常会随着含糊不清的环境而随着规模而增加，但这可以通过提示来改善。

translated by 谷歌翻译

DeepCAVE: An Interactive Analysis Tool for Automated Machine Learning

René Sass , Eddie Bergman , André Biedenkapp , Frank Hutter , Marius Lindauer

分类：机器学习

2022-06-07

自动化机器学习（AUTOML）比以往任何时候都多，以支持用户确定有效的超参数，神经体系结构，甚至是完整的机器学习管道。但是，由于缺乏透明度，用户倾向于不信任优化过程及其结果，因此手动调整仍然广泛。我们介绍了DeepCave，这是一个交互式框架，可轻松和临时分析和监视最新的优化程序。通过旨在实现完全且可访问的透明度，DeepCave在用户和Automl之间建立了桥梁，并有助于建立信任。我们的框架模块化且易于扩展的自然可以为用户提供自动生成的文本，表和图形可视化。我们显示了DeepCave在示例性检测的示例用例中的价值，在该示例性用途中，我们的框架使您易于识别问题，比较多个运行并解释优化过程。该软件包可在github https://github.com/automl/deepcave上免费获得。

translated by 谷歌翻译

QNNVerifier: A Tool for Verifying Neural Networks using SMT-Based Model Checking

Xidan Song , Edoardo Manino , Luiz Sena , Erickson Alves , Eddie de Lima Filho , Iury Bessa , Mikel Lujan , Lucas Cordeiro

分类：人工智能 | 机器学习

2021-11-25

QNNVerifier是第一个用于验证神经网络实现的开源工具，以考虑其操作数的有限字长（即量化）。通过采用最先进的软件模型检查（SMC）技术来实现对量化的新颖支持。它将神经网络的实现基于可满足模数理论（SMT）来将神经网络的实现到一阶逻辑的可解除片段。通过给定硬件确定的精度，通过直接实现来表示固定和浮点操作的影响。此外，Qnnverifier允许指定定制安全性能，并使用不同的验证策略（增量和K-Incuction）和SMT求解器来验证所产生的模型。最后，QNNVerifier是第一个通过间隔分析和非线性激活功能的离散化来组合不变推论的工具，以加快级别验证神经网络的级数。 qnnverifier的视频呈现可在https://youtu.be/7jmgol41zty中获得

translated by 谷歌翻译

Equivariant Subgraph Aggregation Networks

Beatrice Bevilacqua , Fabrizio Frasca , Derek Lim , Balasubramaniam Srinivasan , Chen Cai , Gopinath Balamurugan , Michael M. Bronstein , Haggai Maron

分类：机器学习 | (统计)机器学习

2021-10-06

消息传递神经网络（MPNNS）是由于其简单性和可扩展性而大部分地进行图形结构数据的深度学习的领先架构。不幸的是，有人认为这些架构的表现力有限。本文提出了一种名为Comifariant Subgraph聚合网络（ESAN）的新颖框架来解决这个问题。我们的主要观察是，虽然两个图可能无法通过MPNN可区分，但它们通常包含可区分的子图。因此，我们建议将每个图形作为由某些预定义策略导出的一组子图，并使用合适的等分性架构来处理它。我们为图同构同构同构造的1立维Weisfeiler-Leman（1-WL）测试的新型变体，并在这些新的WL变体方面证明了ESAN的表达性下限。我们进一步证明，我们的方法增加了MPNNS和更具表现力的架构的表现力。此外，我们提供了理论结果，描述了设计选择诸如子图选择政策和等效性神经结构的设计方式如何影响我们的架构的表现力。要处理增加的计算成本，我们提出了一种子图采样方案，可以将其视为我们框架的随机版本。关于真实和合成数据集的一套全面的实验表明，我们的框架提高了流行的GNN架构的表现力和整体性能。

translated by 谷歌翻译